期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 面向大数据处理的并行优化抽样聚类K-means算法
周润物, 李智勇, 陈少淼, 陈京, 李仁发
计算机应用    2016, 36 (2): 311-315.   DOI: 10.11772/j.issn.1001-9081.2016.02.0311
摘要613)      PDF (883KB)(1531)    收藏
针对大数据环境下K-means聚类算法聚类精度不足和收敛速度慢的问题,提出一种基于优化抽样聚类的K-means算法(OSCK)。首先,该算法从海量数据中概率抽样多个样本;其次,基于最佳聚类中心的欧氏距离相似性原理,建模评估样本聚类结果并去除抽样聚类结果的次优解;最后,加权整合评估得到的聚类结果得到最终 k个聚类中心,并将这 k个聚类中心作为大数据集聚类中心。理论分析和实验结果表明,OSCK面向海量数据分析相对于对比算法具有更好的聚类精度,并且具有很强的稳健性和可扩展性。
参考文献 | 相关文章 | 多维度评价